Проверка знаний на собеседованиях — обычная практика. И мы сейчас не о глупых «Где вы видите себя через 5 лет?», а о нормальных вопросах по специальности. В этой статье мы собрали топ-20 вопросов, которые задают дата-сайентистам, чтобы проверить их уровень знаний. Все это реальные вопросы на реальных собеседованиях в российских компаниях. Но нас попросили не упоминать названия, чтобы не давать соискателям лишнего преимущества. Некоторые вопросы простые, другие — посложнее. Не будем затягивать, поехали.
1. В чём разница между контролируемым и неконтролируемым машинным обучением?
Контролируемое машинное обучение:
-
Использует известные и маркированные данные в качестве входных.
-
Имеет механизм обратной связи.
-
Наиболее часто используемые алгоритмы контролируемого обучения — деревья решений, логистическая регрессия и метод опорных векторов.
Неконтролируемое обучение:
-
Использует немаркированные данные в качестве входных.
-
Не имеет механизма обратной связи.
-
Наиболее часто